智能论文笔记

The channel-spatial attention-based vision transformer network for automated, accurate prediction of crop nitrogen status from UAV imagery

Xin Zhang , Liangxiu Han , Tam Sobeih , Lewis Lappin , Mark Lee , Andew Howard , Aron Kisdi

分类：计算机视觉

2021-11-12

农民常规施用氮气（N）肥料以增加作物产量。目前，农民经常在某些位置或时间点上过度应用N肥料，因为它们没有高分辨率作物N状态数据。 N用效率可以很低，剩下的N损失环境，导致生产成本高，环境污染。准确和及时估计作物中的N状况至关重要，从而提高种植系统的经济和环境可持续性。基于组织分析的常规方法在实验室中估算植物中的N个状态是耗时和破坏性的。遥感和机器学习的最新进展表明了以非破坏性方式解决上述挑战的承诺。我们提出了一种新的深度学习框架：一种基于频道空间关注的视觉变压器（CSVT），用于估计从麦田中从UAV收集的大图像的作物N状态。与现有的作品不同，所提出的CSVT引入了通道注意力块（CAB）和空间交互块（SIB），其允许捕获来自UAV数字空中图像的空间和通道功能的非线性特性，以获得准确的N状态预测在小麦作物。此外，由于获得标记的数据是耗时且昂贵的，因此引入了本地到全局自我监督的学习，以预先培训CSVT，具有广泛的未标记数据。建议的CSVT与最先进的模型进行了比较，在测试和独立数据集上进行测试和验证。该方法实现了高精度（0.96），具有良好的普遍性和对小麦N状况估算的再现性。

translated by 谷歌翻译

Robust Unstructured Knowledge Access in Conversational Dialogue with ASR Errors

Yik-Cheung Tam , Jiacheng Xu , Jiakai Zou , Zecheng Wang , Tinglong Liao , Shuhan Yuan

分类：自然语言处理

2022-11-08

Performance of spoken language understanding (SLU) can be degraded with automatic speech recognition (ASR) errors. We propose a novel approach to improve SLU robustness by randomly corrupting clean training text with an ASR error simulator, followed by self-correcting the errors and minimizing the target classification loss in a joint manner. In the proposed error simulator, we leverage confusion networks generated from an ASR decoder without human transcriptions to generate a variety of error patterns for model training. We evaluate our approach on the DSTC10 challenge targeted for knowledge-grounded task-oriented conversational dialogues with ASR errors. Experimental results show the effectiveness of our proposed approach, boosting the knowledge-seeking turn detection (KTD) F1 significantly from 0.9433 to 0.9904. Knowledge cluster classification is boosted from 0.7924 to 0.9333 in Recall@1. After knowledge document re-ranking, our approach shows significant improvement in all knowledge selection metrics, from 0.7358 to 0.7806 in Recall@1, from 0.8301 to 0.9333 in Recall@5, and from 0.7798 to 0.8460 in MRR@5 on the test set. In the recent DSTC10 evaluation, our approach demonstrates significant improvement in knowledge selection, boosting Recall@1 from 0.495 to 0.7144 compared to the official baseline. Our source code is released in GitHub https://github.com/yctam/dstc10_track2_task2.git.

translated by 谷歌翻译

Suffix Retrieval-Augmented Language Modeling

Zecheng Wang , Yik-Cheung Tam

分类：自然语言处理

2022-11-06

Causal language modeling (LM) uses word history to predict the next word. BERT, on the other hand, makes use of bi-directional word information in a sentence to predict words at masked positions. While BERT is effective in sequence encoding, it is non-causal by nature and is not designed for sequence generation. In this paper, we propose a novel language model, SUffix REtrieval-Augmented LM (SUREALM), that simulates a bi-directional contextual effect in an autoregressive manner. SUREALM employs an embedding retriever to search for training sentences in a data store that share similar word history during sequence generation. In particular, the suffix portions of the retrieved sentences mimick the "future" context. We evaluated our proposed model on the DSTC9 spoken dialogue corpus and showed promising word perplexity reduction on the validation and test set compared to competitive baselines.

translated by 谷歌翻译

Learning to diagnose common thorax diseases on chest radiographs from radiology reports in Vietnamese

Thao T. B. Nguyen , Tam M. Vo , Thang V. Nguyen , Hieu H. Pham , Ha Q. Nguyen

分类：计算机视觉

2022-09-11

我们提出了一个数据收集和注释管道，该数据从越南放射学报告中提取信息，以提供胸部X射线（CXR）图像的准确标签。这可以通过注释与其特有诊断类别的数据相匹配，这些数据可能因国家而异。为了评估所提出的标签技术的功效，我们构建了一个包含9,752项研究的CXR数据集，并使用该数据集的子集评估了我们的管道。以F1得分为至少0.9923，评估表明，我们的标签工具在所有类别中都精确而始终如一。构建数据集后，我们训练深度学习模型，以利用从大型公共CXR数据集传输的知识。我们采用各种损失功能来克服不平衡的多标签数据集的诅咒，并使用各种模型体系结构进行实验，以选择提供最佳性能的诅咒。我们的最佳模型（CHEXPERT-FRECTER EDIDENENET-B2）的F1得分为0.6989（95％CI 0.6740，0.7240），AUC为0.7912，敏感性为0.7064，特异性为0.8760，普遍诊断为0.8760。最后，我们证明了我们的粗分类（基于五个特定的异常位置）在基准CHEXPERT数据集上获得了可比的结果（十二个病理），以进行一般异常检测，同时在所有类别的平均表现方面提供更好的性能。

translated by 谷歌翻译

A Survey of Machine Unlearning

Thanh Tam Nguyen , Thanh Trung Huynh , Phi Le Nguyen , Alan Wee-Chung Liew , Hongzhi Yin , Quoc Viet Hung Nguyen

分类：机器学习 | 人工智能

2022-09-06

数十年来，计算机系统持有大量个人数据。一方面，这种数据丰度允许在人工智能（AI），尤其是机器学习（ML）模型中突破。另一方面，它可能威胁用户的隐私并削弱人类与人工智能之间的信任。最近的法规要求，可以从一般情况下从计算机系统中删除有关用户的私人信息，特别是根据要求从ML模型中删除（例如，“被遗忘的权利”）。虽然从后端数据库中删除数据应该很简单，但在AI上下文中，它不够，因为ML模型经常“记住”旧数据。现有的对抗攻击证明，我们可以从训练有素的模型中学习私人会员或培训数据的属性。这种现象要求采用新的范式，即机器学习，以使ML模型忘记了特定的数据。事实证明，由于缺乏共同的框架和资源，最近在机器上学习的工作无法完全解决问题。在本调查文件中，我们试图在其定义，场景，机制和应用中对机器进行彻底的研究。具体而言，作为最先进的研究的类别集合，我们希望为那些寻求机器未学习的入门及其各种表述，设计要求，删除请求，算法和用途的人提供广泛的参考。 ML申请。此外，我们希望概述范式中的关键发现和趋势，并突出显示尚未看到机器无法使用的新研究领域，但仍可以受益匪浅。我们希望这项调查为ML研究人员以及寻求创新隐私技术的研究人员提供宝贵的参考。我们的资源是在https://github.com/tamlhp/awesome-machine-unlearning上。

translated by 谷歌翻译

Enhancing Early Lung Cancer Detection on Chest Radiographs with AI-assistance: A Multi-Reader Study

Gaetan Dissez , Nicole Tay , Tom Dyer , Matthew Tam , Richard Dittrich , David Doyne , James Hoare , Jackson J. Pat , Stephanie Patterson , Amanda Stockham

分类：人工智能

2022-08-31

目的：本研究评估了市售可解释的AI算法在增强临床医生在胸部X射线（CXR）上鉴定肺癌的能力的影响。设计：这项回顾性研究评估了11位临床医生在胸部X光片中检测肺癌的表现，并在有和没有市售的AI算法的帮助下（红点，观察到），预测CXRS可疑的肺癌。根据临床确定的诊断评估了临床医生的表现。设置：该研究分析了NHS医院的匿名患者数据；该数据集由成年患者（18岁及以上）的400张胸部X光片组成，他们在2020年进行了CXR，并提供相应的临床文本报告。参与者：由11位临床医生（放射科医生，放射科医生受训者和报告射线照相师）组成的读者小组参加。主要结果指标：临床医生在CXR上检测肺癌的总体准确性，敏感性，特异性和精度，有或没有AI输入。还评估了有或没有AI输入的临床医生与绩效标准偏差之间的协议率。结果：临床医生对AI算法的使用导致肺部肿瘤检测的总体性能提高，从而达到了在CXR上鉴定出的肺癌的总体增长17.4％，分别增加了13％和13％的阶段1和2期肺癌的检测，以及临床医生表现的标准化。结论：这项研究在AI算法的临床实用性方面表现出了巨大的希望，可以通过整体改善读者表现来改善早期肺癌诊断和促进健康平等，而不会影响下游成像资源。

translated by 谷歌翻译

Model-Agnostic and Diverse Explanations for Streaming Rumour Graphs

Thanh Tam Nguyen , Thanh Cong Phan , Minh Hieu Nguyen , Matthias Weidlich , Hongzhi Yin , Jun Jo , Quoc Viet Hung Nguyen

分类：人工智能 | 机器学习

2022-07-17

在社交媒体上传播谣言对社会构成了重要威胁，因此最近提出了各种谣言检测技术。然而，现有的工作重点是\ emph {what}实体构成谣言，但几乎没有支持理解\ emph {为什么}实体已被归类为这样。这样可以防止对检测的谣言以及对策设计的有效评估。在这项工作中，我们认为，可以通过过去检测到的相关谣言的例子来给出检测到的谣言的解释。一系列类似的谣言有助于用户概括，即了解控制谣言的探测的特性。由于通常使用特征声明的图表对社交媒体的谣言传播通常是建模的，因此我们提出了一种逐个示例的方法，鉴于谣言图，它从过去的谣言中提取了$ k $最相似和最多的子图。挑战是所有计算都需要快速评估图之间的相似性。为了在流式设置中实现该方法的有效和适应性实现，我们提出了一种新颖的图表学习技术，并报告了实施注意事项。我们的评估实验表明，我们的方法在为各种谣言传播行为提供有意义的解释方面优于基线技术。

translated by 谷歌翻译

Parameter-Efficient Prompt Tuning Makes Generalized and Calibrated Neural Text Retrievers

Weng Lam Tam , Xiao Liu , Kaixuan Ji , Lilong Xue , Xingjian Zhang , Yuxiao Dong , Jiahua Liu , Maodi Hu , Jie Tang

分类：自然语言处理 | 机器学习

2022-07-14

及时调整尝试更新预训练模型中的一些特定任务参数。它的性能与在语言理解和发电任务上的完整参数设置的微调相当。在这项工作中，我们研究了迅速调整神经文本检索器的问题。我们引入参数效率的及时调整，以调整跨内域，跨域和跨主题设置的文本检索。通过广泛的分析，我们表明该策略可以通过基于微调的检索方法来减轻两个问题 - 参数 - 信息和弱推广性。值得注意的是，它可以显着改善检索模型的零零弹性概括。通过仅更新模型参数的0.1％，及时调整策略可以帮助检索模型获得比所有参数更新的传统方法更好的概括性能。最后，为了促进回猎犬的跨主题概括性的研究，我们策划并发布了一个学术检索数据集，其中包含18K查询的87个主题，使其成为迄今为止特定于特定于主题的主题。

translated by 谷歌翻译

Mechanical Search on Shelves with Efficient Stacking and Destacking of Objects

Huang Huang , Letian Fu , Michael Danielczuk , Chung Min Kim , Zachary Tam , Jeffrey Ichnowski , Anelia Angelova , Brian Ichter , Ken Goldberg

分类：机器人

2022-07-05

堆叠提高了架子上的存储效率，但是缺乏可见性和可访问性使机器人难以揭示和提取目标对象的机械搜索问题。在本文中，我们将横向访问机械搜索问题扩展到带有堆叠项目的架子，并引入了两种新颖的政策 - 堆叠场景（DARSS）和Monte Carlo Tree搜索堆叠场景（MCTSSS）的分配区域减少 - 使用Destacking和恢复行动。 MCTSS通过在每个潜在行动后考虑未来的状态来改善先前的LookAhead政策。在1200次模拟和18个物理试验中进行的实验，配备了刀片和吸力杯，这表明命令和重新攻击动作可以揭示目标对象的模拟成功率为82---100％，而在物理实验中获得了66----100％对于搜索密集包装的架子至关重要。在仿真实验中，这两种策略的表现都优于基线，并获得相似的成功率，但与具有完整状态信息的Oracle政策相比采取了更多步骤。在模拟和物理实验中，DARS在中位数步骤中的表现优于MCTSS，以揭示目标，但是MCTSS在物理实验中的成功率更高，表明对感知噪声的稳健性。请参阅https://sites.google.com/berkeley.edu/stax-ray，以获取补充材料。

translated by 谷歌翻译

Quantum Neural Architecture Search with Quantum Circuits Metric and Bayesian Optimization

Trong Duong , Sang T. Truong , Minh Tam , Bao Bach , Ju-Young Ryu , June-Koo Kevin Rhee

分类：机器学习

2022-06-28

量子神经网络在嘈杂的中间量子时代的广泛应用方面有希望。因此，对自动量子神经架构搜索的需求不断增长。我们通过设计高斯工艺的贝叶斯优化的量子电路指标来应对这一挑战。为了实现这一目标，我们提出了一个新的量子门距离，该距离距离，以每个量子状态的行动为特征，并就其几何特性提供理论观点。我们的方法极大地超过了三个经验量子机学习问题的基准，包括培训量子生成的对抗网络，在MaxCut问题中求解组合优化以及模拟量子傅立叶变换。我们的方法可以扩展以表征各种量子机学习模型的行为。

translated by 谷歌翻译